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Hardware with decoupled configuration register partitions data flow or 
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Abstract Of DE19926538 

The hardware has a decoupled configuration register and performs programs on a component with a 
single or multi-dimensional cell structure. Data flow or control flow graphs are partitioned into time- 
separated sub-graphs and formed sequentially and implemented on the component. An Independent 
claim is also included for a method for performing programs on a component with a single or multi- 
dimensional cell structure. 
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(§) Hardware und Betriebsverfahren 

@ Die Erfindung betrifft eine ein- odar mehrdimensionale 
Zallstruktur. Hrerbei ist eine zeitllch getrennte Sequenzie- 
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Beschrcibung 
Aufgabe der Erfindung und Anwenduogsbereiche 

s Die vorliegende Erfindung erstreckt sich auf das Gebiet von programmierbaren und insbesotidere wahrend des Betrie- 
bes umprogranumeibaren aiitbmetischen und/oder logischen Bausteinen mit Vielzahl von arithmedschen und/oder logi- 
schen Hnheiten, deien Verschaltuag ebenfalls piogranuniBrbar und wahrend des Betiiebes umprogrammierfoar ist. Der- 
artige logiscbe Bausteine sind unteir dem Oberbegriflf FPGA von verschiedenen Firmen vesrfugbar. Weiterhin sind meh- 
reie Patente veroQentlicbt, die spezielle arithniBtische Bausteine mil aucomadscfaer Datensynchronisation und verbesser- 

10 ten offienlegen. 

Samdiche beschiiebene Bausteine besitzen eint zwei- oder mehrdimensionale Anordnung von logischen und/oder 
aiithmetischen Einheitcn. die Uber Bussysteme miteinander verschaitbar sind. 

Aufgabe der Erfindung ist es, ein ProgrammiexverfahieD zur V^rfugung zu stdlen, das es ermoglicht die beschriebenen 
Baustdne in gewohnlichen Hocbsprachen effizient zu (^ogrammieren und dabei die Vorteile der durch die Vielzahl von 
IS Einheiten entstehende Parallelilat der beschriebenen Bausteine weitgehend automatisch, vollst^dig und efBzieni zu nut- 
zen. 

Stand der Technik 

20 Bausteine der genannten Oattung werden zumeist untcr Verwendung gewohnHcher Datenflissprachen programnuert 
Dabed treten zwei grundlegende KcDbleme auf: 

1 . Die Frogranmiierung in DatenilusspradieD ist fur PiDgiammiorer gewShnungsbediirftig, tief sequentielle Au^a- 
ben lassen sich nur sehr ums^dlich beschreiben. 
25 2. Gro6e Applikationen und sequendeQe Bescfareibungen lassen sich mit den bestehenden Obersetzungsprogram- 
men (Synthese-Tools) nor bedingt auf die gewiinschte Zieltechnologic abbilden (synthedsieren). 

Fur gewdhnlich werden Applikationen in mehiere Teilapplikationen partitioniert, die dann einzein auf die 2Seltechno- 
logie synthetisiert woden (Fig. 1). Die einzelnen BinSicodes werden dann auf jeweils einen Baustein geladen. 'V^ent- 
30 liche Voraussetzung der Erfindung ist das in DE 44 16 881 beschriebene Verfahren, das es ermOglicht, mehrere parddo- 
nierte Teilapplikationen innarhalb eines Bausteines zu nutzen, indem die zeitliche Abh^ngigkeit analysiert wird und Uber 
Steuersignale sequentiell die jewedls erforderlkhen Ibilapphkationen bei einurubeigeordneten Ladeeinheit angeforttert 
und von dieser daraufhin auf den Baustein geladen werden. 
Existierende Synthese-Tools sind nur bedingt in der Lage I^ogiamm-Schleifen auf Bausteine abzubilden (Fig. 2 
35 («201)). 

Dabei werden sogenannte FOR-Schleifen (0202) als Flimitiv-Schleife haufig noch daduich unterstutzt, daS die 
Schleife vollkonunen auf dieRessourcen des Zielbausteines ausgewalzt werden. 

WHILE-Schleifen (0203) besitzen im Gegensatz zu FOR-Schleifen keinen konstanten Abbnichswert. ^elmehr wird 
durch dne Bedingung evaluiert, wann der Schleifenabhruch stattfindet. Daher ist gewohnlicherweise (yfean die Bedin- 
40 gung nicht konstant ist) zur Syntbesezeit nicht bekannt, wenn die Schleife abbricht Durch das dynamische 'S^dialiea 
konnen Synthese-Tools diese Schleifen nicht fest auf Hardware abgebildet d. h. auf einen Zielbaustein Qbertragen wer- 
den. 

Rekursionen sind grunds3tzlicb nicht auf Haidwaie abbildbai; wann die Rekursronsdefe nicht zur Synthesezeit be- 
kannt und daout konstant ist Bei der Rekursion werden mit jeder neuen Rekuisionsebene neue Ressourcen allokiert Das 
4S wiirde bedeuten, daB mit jeder Rekursionseboie neue Haidvrare zur ^%a:fugung gestellt werden muB, was aber dynamiscfa 
nidit m6glich ist. 

Selbst einfacbe Grundstnikturra sind von Synthesetools nur dann abbildbar, weim der Zielbaustein ausreicbend groB 
ist, d. h. ausieichende Ressourcen bietet 

Einfacbe zeidicbe AbhSngigkeilen (0301) werden duich heutige Synthese-Ibols nicht in mehrere Teilapplikadonen 
50 partidonieit und sind deshalb nur als Ganzes auf einen Zielbaustein ubertragfoar. 

Bedingte Ausfiihrungen (0302) und Schidfen iiber Bedingungen (0303) sind ebenfalls nur abbildbai; wenn ausrei- 
chende Ressourcen auf dem ZielbausteiD exisderen. 

ErfindungsgemaBes \%ifahien 

55 

Durch das in DE 44 16 881 beschriebene Verfabicn ist es moglich Bedingungen zur Laufedt innerhalb der Hardwaie- 
strukturen der genannten Bausteine zu erkennen und derart dynamisch darauf zu reagieien, daS die Funkdon der Hard- 
ware entsprecbend der eingetretenen Bedingung modifiziert wird, was im wesendidien dutch das Konfigurieien einer 
neuen Struktur geschieht. 

60 Ein wesentlicher Schritt in dem erfindungsgemaSen ^%rfahI6n ist die Partidonierung von Oraphen in zeitlich unabban- 
gige Teilgr^hen. 

Der Begriff "zeidiche Unabhangigkeit" wild daoiit definiert, daB die Daten, die zwischen zwei Ibilapplikadoiien uber- 
tragen werden durch einen Speicher, gleich welcher Ausgestaltung (also auch mittels einfacher Register), entkoppelt 
werden. Die ist besonders an den SteUen eines Gr^^en moglich, an denen eine klare Schnittstelle mit einer begrenzten 
65 und mdglicbst minimalen Menge von Signalea zwiscben den beiden Ibilapplikadonen besteht. 

Die zeitliche Unabhangigkeit kann in grofien Graphen durch das gezielte Einfiigen von klar definierten und mciglichste 
einfachen Schnittsiellen zum Speichem von Daten in einen Zwischraspeicher heibdgefuhrt werden (vgl. So in Fig. 4). 
Schidfen wetsen grundsatzlich eine starke zdtliche Unabhangigkeit auf, da sie lange Zeit (iber einer besdmmten Menge 
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von (zumeist) in der Schleife lokalen Variablen aibeiten und nur beim Schleifeneintritl und beim verlassen der Schleife 
eine Ubcrtragung der Operanden bzw. des Ergebnisses eafordem. 

Durch die zeitliche Unabhangigkeit wird eneicht, dafi aach der vollstMiidigen Ausfuhrung einer Ibilapplikadon die 
nachfolgende Ibilapplikadon geladea werdea kann, ohne daB iigendwelche weiteren Abhangigkeiten oderEinfliisse auf- 
treten. Beim Speichem der Daten in den genannten Speicher kann ein Signal (Ihgger) generieit werden, das die Ubeige- s 
oidneten Ladeeinheit zum Nachladeo der nachsten Ibilapplikation auSbrdert Der logger kann bei der Verweodung von 
einfachen Registem als Speicher immer generiext werden, v/eua das Register beschrieben wird. Bei der Xferwendung von 
Speichem, i. b. von solchen die nach dem HFO-Prinzip aibeiten, ist dieGeneiierung des lYiggers von mehreien Bedin- 
gungen abhSngig. 

Folgende Bedlngungen konnen beispielsweise einzeln oder konobimert ein Ihgger eizeugen : lo 



Ergebnis-Speidier voll 
Operanden-Speicher leer 
kdne neuen Operanden 

Beliebige Bedingung inneaiialb der Teilapplikation, generiert durch z. B. is 

Veigleicher 

Zahler. 



Eine Teilapplikation wild im folgenden auch Modul genannt, urn die Verstandlicbkeit aus Sicbt (ter klassiscben Vio- 
giammiening zu erhohen. Aus demselben Qrund werden Signals im folgenden auch ^riablen goiannt. Dabei unter- 20 
scbeiden sich die Variablen in einetn Punkt wesentlicb von berkonunlichen Variablen: Jeder Variable ist dn Statussignal 
(Ready) zugeordnet, das anzeigt, ob die Variable einen gilltigen Wert besitzt. Wenn ein Signal eineo gultigen (benecfane- 
ten) Wert besitzt, ist das Statussignal Ready; wenn das Signal keinen giiltigen Wert besitzt (Beiechnung noch nidit ab- 
geschlossen), ist das Statussignal NotJReady. Das Piinzip ist ausfUhriidi in der Patentanmeldung PACro2 beschrieben. 

25 

Das IVozessormodell 



Dit in den folgenden Figuren gezeigten Grapben besitzoi als Graphenknoten immer in Modul, wobei davon ausge- 
gangen wird, daB mehrere Module auf men Zielbaustein abgebildet werden konnen. Das heiBt, obwohl alle Module zeit- 
lich voneinander unabhangig sind, wird nur bei nach den Modulen eine Umkonfiguration durcfagefUhrt, bzw. ein Daten- 30 
speicher eingefugt. die mit einem vertikaleQ Strich und ^t matkiert sind. Dieser Punkt wttd Umkonfigurationszei^unkt 
genannt 

Das bedeutet zusammenfassend: 



1 . GroBe Module konnen an geeigneten Stellen partitioniert werden und in kleine zeitlich voneinander unabhSngige 3S 
Module zeiiegt wetden. 

2. Bei Ideinen Modulen die sich gemeinsam auf ednen Kelbaustein abgebildet werden konnen, wird auf die zdtE- 
che Unabhangigkdt veiTichtet Dadurcfa werden KonfigurationsscfatiUe eingespart und die Daienverarbeitung be- 
schleunigt 

3. Die Ufflkcmflguraticxiszei^junkte werdm entsprechend der Ressourcen der Zielbausteine positioniert Dadurch 40 
ist eine beliebige Skalierung der GraphcalSnge gegeben. 

In Fig. 4a sind einige grundlegenden Eigenschaften des erfindungsgemaSen ^^abrens dargestellt: 
Die Module des lypes A sind zu dner Gruppe zusaimnengefaBt und besitzen am Ende einen bedingten Sprung, entweder 
nach Bl oder B2. An dieser Position (0401) ist ein Umkonfigurationspunkt eingeftigt, da es sinnvoU isl die Zwdge des 45 
bedingten Sprunges als jeweils dne Gruppe zu betrachten (Fall 1). WOrden dagegen bidde Zwdge von B (Bl und B2) zu- 
satzHch zu A auf den Zidbaustdn passen (Fall 2), ware es sinnvoll nur einen Umkonfigurationspunkt bd 0402 einzufii- 
gen, da dadurdi die Zahl der Konfigurationen veiringert wid und sich die \%rarbdtungsgeschwindigkeit eifaSht Beide 
Zwdge (B 1 und B2) springen bd 0402 nach C. 

Die Konfiguralion der Zellen auf dem Zielbaustein ist in Hg. 4b schematiscb dargestellL Dabei werden die Funktionen so 
der einzelnen Gr^henknoten auf £c Zellen des Zielbausteins abgebildeL Jeweils eine Zeile stellt dne Konfiguratioa dar. 
Die gestrichelten Pfeile bei einem Zeilenwechsel zeigen dne Umkonfiguradon. Sg ist eine datenspdchemde Zelle, von 
beliebiger Ausgestaltung (Register, Speicher, etc.). Dabei ist SqI ein Spdcber, der Datra entgegennimmt und SnO ein 
Speicher der Daten ausgibL Der Speicher Sn ist fur gleiche n jeweils deiselbe, I und O kennzdchnen die Datentransfer- 
richtung. ss 

Bdde I^e des bedingten Sprunges (Fall 1 , Fall 2) sind dargestellt 

Das Modell in Fig. 4 entspricht dnem DatenfluGmodell, jedoch mit der wesentlichen Erweiterung der Umkonfigura- 
tionspunkt und der damit erreicbbaren Partidonierung des Grapben, wobd die zwischen den Partitionen iibertragenen 
Daten zwiscfaengespdcheit werden. 

Im Modell von Fig. 5a wird aus dner beliebigen Graphenmenge und -Konstellation (0501) selektiv ein Graph aus d- 60 
ner Menge von Graphen B aufgerufen. Nach der Ausfuhrung von B gelangen die Daten nach 0501 zuriick. 

Wild in 0501 ein ausrdchend groBer Sequencer (A) implementiert, ist mit dem Modell dn den typischen Prozessoren 
sehr ahnliches Prinzip implementierbar. Dabd gelangen 

1 . Daten in den Sequenzer A, die dieser als Befehle dekodtert und entspiechend dem "von Neumann"-Prinzip dar- 65 
aufreagiert; . 

2. Daten in den Sequenzer A, die als Daten betrachtet werden und an dn fest konfigurieites Recbenwerk C zur Be- 
iechnung weiteigeldtet werden. 
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Ver Graph B stellt selektierbar ein besondercs Rechenwerke und/odex besondeie Opcodes fiir bestimnite Fuoktionen 
2ur Verfiigung und wird alteraativ zurBeschleunigung von C verwendet. BeispieLsweise kann Bl ein opdmieiter Algo- 
rithmus zu Berechnung von MatrixmultipUkationen sein, wahicnd B2 cinen FER-Filter und B3 eine Mustereikennung 
s daistellt. Entsprechend eines (^)Oodes der von 0501 dekodiert wird, wild Atx geeignete bzw. entsprechende Graph B auf- 
genifen. 

Fig. 5b schematisiert die Abbitdung auf die einzdnen Zdlen, wobei in 0502 der pipelineaitige Rechenwcrks-Charac- 
ter symbolisiert wird. 

Wahrend in den Umkonfigurationspunkten von E1g.4 vorzugsweise groBere Speicherzam Zwiscbenspeicbem derDa- 
10 ten eingefugt weiden, ist eine einfache Synchronisation der Daten in den Umkonfigurationspunkten von Fig. 5 ausiei- 
chend, da der Datenstrom vorzugswdse gaozer durch den Graphen B Mufl und der Graph B nicht weiter paititionieit 
ist; dadurch ist das Zwischenspcichern der Daten DberilOssig. 

In Fig. 6a sind verschiedene Scbleiien daigestellL Sdileifen konnen gnmdsatzlich auf drei Arten behandelt warden: 

15 1. Hardwaie-Ansatz: Schleifen weiden vollstandig ausgewalzt auf die Zielhaidware abgebildet (0601a/b). W\e be- 
teits erlautert ist dies nur bei wenigen Schleifenaiten moglich. 

2. DatenfluB-Ansatz: Innerfaalb der Datenflusses wenden Schleifen Qber mehrere Zellcn hinweg aufgebaut 
(0602a/b). Gas £nde der Schleife wird auf den Schleifenaniang liickgekoppelt 

3. Sequenzer-Ansatz: Hn Sequenzer mit minimaLBm Befehlssatz fiihrt die Schleife aus (0603a/b). Dabei sind die 
20 Zellen der Zielbausteine so ausgestaltet, daB sie den entsprechenden Sequenzer beinhalten (vgl. Fig. I la/b). 

Durch eine geeignete Zerlegung von Schleifen kann deren Ausfuhrung ggf. optimiert werden: 

1, Unter Verwendung von Optinuemngsmethoden nach dem Stand der Technik laBt sicfa haufig der Scfaleifen- 
25 rumpf, also der wiederfaolt auszuflihiende Tbil, daduich optimieren, daB bestiimnte Qperaticmen aus dCT Schleife 

entfemt weixtei und vor oder hinter die Schleife gesteUt werden (0604a/b). Dadurch wird die Menge der zu sequen- 
cenden Befefale eAeblich reduziert. Die eatfemten Opeiationen werden nur einmal vor bzw. nach Ausfuhnmg der 
Schleife duichlaufen. 

2. Hne weitere OptimieiungsnidglichkBit ist das Teilen von Schleifen in mehrere kleinere oder kiirzere Schleifen. 
30 Dabei findet die 'Ibilung derail statt, daB mehrere parallele oder mehrere sequentielle (060Sa/b) Schleifen oitstehen. 

F^. 7 verdeutlicbt die Implementierung einer Rekursioa Dabei wuden dieselben Hessourcen (D701) in Form von 
Zellen fur jede Rekursions^ene (1-3) verwendet Die Eigebnisse einer jeden Rekursioasebene (1^) werden beim Auf* 
bau (0711) in einen nach dem Stack-Prinzip au^ebauten Speicher (0702) geschrieben. Gl^chzeitig mit dem Abbau 
35 (0712) der Ebenen wird der Stack abgebaut 

Hochspiachenbdspielfi 
Ein Modul kann bei^ebweise folgendermaSen deklariert weiden: 
apdale examplel 

input (varl, var2 : tyi; var3 : tya) . 
output (real, res2 : tyj) . 
begin 

• • • 

<regnaine2> (res2} . 
dwitee (resl & res2; 1). 
«iid. 

module kennzeicbnet den Be^n cines Modules. 
60 input/output definiot die ^-/Ausgangsvariablen mit den IVpen ty,. 
begin . . . end marideren den Rumpf des Modules. 

register <regname l/2> ubergibt das Eigebnis an den Output, wobei des Ergebnis in dem durch <regname l/2> spezifizier- 
iea Register zwischengespeichert wird. <regnamel/2> ist dabei eine globale Refbrenz auf ein bestimmtes Registei: 
Als weitere Ubergabemodi an den Output stehen beispielsweise folgende Speicherarten zur V^rfiiguDg: 
65 fifo <fifoname>, w(Aei die Daten an einen nach dem JhUO-Ptinzip arbeilenden Speicher iibeigeben wezden. fifoname iBt 
dabei eine globale Refecenz auf einen bestimmten, im FIFO-Modus arbeitenden Speicbec tenninatB@ wiid dabei um 
den Parameter bzw. das Signal. "fifofuU" eiweitert, der/das anzdgt, daB der Speicher voll isL 

stack <stackname>, wobei die Daten an einen nach dem Stack-Prinzip arbeitenden Speicher iibeigeben werden. stack- 



40 



45 



so 



ss 
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name ist dabei eine globaleReferenz auf einen bestimmten, im Stack-Modus arbeitenden Speicher. 
terminate® unterscbeidet die Programmiening entspiechend des erfindungsgemaBen Verfahrens von der herfcoimnli- 
chen sequentiellen Programmiening. Der Befehl definiert das Abbruchkriterium des Modules. Die Eigebnisvariablen 
resl und ies2 werden von terminate© nicht mit ihiem tatsachlichen Wert evaluiert, statt dessen wird nur die Giiltigkeit 
der V^ablen (also dercn Slatussignal) gepriift. Sind beide Variablen giiltig, terminicrt das Modul mit dem Wert 1. Das 
bedeutet, ein Signal mit dem Wert 1 wird an die iibergeordneten Ladeeinheil weitergeteitet, woraufhin die iibergeordne- 
teo Ladeeinheit das nachfolgende Modul ladt. 

inpBt (varl, var2 ; tyj; var3 : tya) . 

mi^t (resl i ty*) . 

bagia 

xoglater <regnamel> (varl, var2> . 

• • « 

ttto <fifonainel> (resl, 25fi) . 

traiaatei (fifofuli«fifonamel>) ; 1). 
«ad. 

register wird in diesem Beispiel fiber input-Daten definiert. Dabei ist <regnamel> dersdbe wie in examplel. Dies be- 
wirkt, daB das Eegistei; das die output-Daten in examplel uifhimmt, die input-Daten fltr BxamplB2 zur N^fiigung stellt. 
fifo definiert einen FIFO-Speicber der Tfefe 256 fiir die Ausgangsdaten resl . Das Full-Flag (fifofull) des EIFO-Speichere 
wird in terminate® als Abbruchkriterium verwendet. 

■odala main 

inpttt (Inl, in2 : tSrn in3 : tya). 

OQtpQt (outl ; ty4). 

begia 

dttfiaa <regnamel> : register (234 ) , 
dofiaa <regnaine2> : register (26) . 
daflaa <fifonamel> : fifo (4). 

(varl2, var72) = eall examplel (inl, in2, in3) . 

(outlj = call exainple2 (varl2, var72, var243) . 
• • » 

signal (outl). 
tazBinatoe .(exanple2}. 

d^ne definiert eine SchoittstelLe fiir Dateo (Register, Speicher, etc.). Bei der Definition werden die erforderlicbeD Res- 
sourcen, sowie die Bezeichnung der ScfanitlsteUe angegeben. Da die Ressourcen eindeutig angegeben werden und nur 
einmal verwendet werden kSnnen, ist die Definition global, d. h. die Bezeichnung gilt fiir das gesamte Programm. 
call ruft ein Modul als Untetixogramm auf. 

signal definiert ein Signal als AusgangssignaU ohne daB eine Zwiscbenspcicherung verwendet wird. 

Durcfa terminatB® (6xample2) wird das Modul main terminiert, sobald das Unterprogranmi example2 terminiert. 

Durcfa die globale Deklaradon "define ..." ist es priimpielL nicht melir notwendig, die so definierten input/output Si- 
gnale in die Scbnittstellen-Deklaraiiai der Module aufzunehmen. Die entsprechend modifizierten Bdspiei-Modole wiir- 
den dann folgendeimaSen aussehen: 
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S Die Zustandsinformatioaen des Prozessormodells 

Zur Bestinunung der Zust^de innerhalb eines Graphen werden die Statusregister der einzelnen Zellen (B^Es) Uber 
ein zusatzlich zum Datenbus (0801) existieiendes Status-Bussystem (0802) alien anderen Rechenwerken zur VerfUgung 
gestellt (Big. 8b). Das bedeutet, daB eine Zelle (PAE X) die Statusinformadcm einer andesren Zelle (PAE Y) evaluieren 
10 kma und dementsprechend die Daten veraibeitet. Um den Unterschied zu bestehenden Parallerechnersystemen zu ver- 
deutlichen, ist in Hg. 8a der Stand der Ifechnik angegeben. Dabei ist ein Multiprozessorsystem gczeigl, dessen Prozes- 
soien iiber einen gemelnsamen Datenbus (0S03) miteinandcx verbunden sind. Ein explizites Bussystem fiirden synchro- 
nea Austausch von Daten imd Status exisdert nichL 
AbschlieBend soU angemerkt wecden, daB je nach Aufgabe sowohl derDatenfluBgraph, als auch der KontroMuBgraph 
IS enisprechend dem beschriebenen Verfahren behandelt weiden kann. 

&weiteruDg«n in der Hardware gegenUber PACT02 ui»l R\CT04 

Durch PACTQ2 und PACT04 ist der Stand der Tfechmk in Bezug ajif die Konfigurationseigenschaften von Zellen (PA- 
20 Es)defiaiert und verSffentlicht in DE 196 51 075 (PACTO2) sowie in DE 196 54 846 (PACIW). 
Dabei soli auf zwei Eigenschaften eingegangen warden: 

1. Hner PAE ist gemaB PACT02 ein Satz von Konfigtu^onsr^istem zuge<»rdnet, dor eine Xonfigisration beinhal- 
tet (Fig. 8a). 

25 2. Gne Gruppe von PAEs kann gemaS PACT04 auf einen Speicher zum Speichem oder Lesen von Daten zugreifen 
(Kg. 8b). 

Aufgabe ist es, 

30 a) doVerfafaienzusdbaffen,dasdasUnikoniigurieien voaPAEsbeschleunigtundzdtUcbvonderUb 
Ladeeinhedt eotko^pelt, und 

b) das Verfahim so auszulegen. daB gleichzeitig die Mdglichkeit gescfaaffen wird iiber mehrere Konfigurationen zu 
Seqnenzen. 

35 

Entkopplung der Konfigurationsiegister 

Das Konfigurationsregister wird von der ubeigeordneten Ladeeinheit (CT) entkoppelt (Fig. 9), indem ein Satz voa 
mebreren Konfigurationsregistem (0901) verwendet wird. Immer genau eines der Konfigurationsregister bestimmt se- 
40 lektiv die Funktion dar PAE. Die AiKwahl des aktiven Registers wird iiber einen Multiplexer (0902) durchgefilhrt In je- 
des der Konfigturitionsregister kann die CT beliebig schreiben, sofiam dieses nicht die aktuelle Konfiguiation der PAE 
bestimmt. Welches Konfigurationsiegister von 0902 selekticTt wird kann duich verscfaiedene Quellen bestimmt werden: 

1 . Bin beliebiges StaUis-Signal oder eine Gruppe beliebiger Status-Signale, die iiber ein Bussystem (0802) an 0902 
45 gefiihrt werden (Fig. 9a). Die Status-Signale werden dabei von beliebigen PAEs generiert oder durch exteme Ad- 

schltisse des Bausteins zur VerfUgung gestellt (vgl. Fig. 8). 

2. Das Status-Signal der PAE, die von 0901/0902 konfiguiieit wird, dient zur Selektion 9b). 

3. Hn von der iibeigeordneten CT generiertes Signal di«it zur Seleklion (Fig, 9c). 

so Dabei ist es mdglicb wablweise die eingehraidai Signale (0903, 0904, 090S) mittek does Registers fiir anea be- 
stimmten Zeitraum zu speichem. 

Durch den Einsatz mehrere Register wird die CT zeitlich entkoppelt. Das bedeutet, die CT kann mehrere Konfigura- 
tionen "voriaden", obne daB eine direkte zeitliche Abhangigkeit bestehL 
Lediglich das selektiecte Register in 0901 noch nicht geladen ist, wird mit der Kcxifiguiation der PAE so lange gewar- 
SS tet, bis die CT das Register geladen hat. Um festzusteUen, ob ein Register eine gflltige Information besitzt kann ein 
lid-Bit" (0906) pro Register eingefiihrt werden, das von der CT gesetzt wird. Ist 0906 bei einem selektieiten Register 
nidit gesetzt, wild iiber ein Signal die CT zum schnellstmoglichen Setzten des Regiaers aufgefordert 

Das in Fig. 9 beschriebene Verfahren ist einfacb zu einem Sequenzer erweiterbar (Fig. 10). Dazu wird ein Mikrokon- 
troller (1001) zur Ansteuerung der Selektionssignak des Multiplexes (0902) verwendet Der Sequenzer be^immt dabei 
60 abh&igig von der akOKlI selektierten Konfiguration (1002) und einer zusaizlichen Statusinformation (1003/1004) die 
nachste zu selektierende Konfiguration. Dabei kann die Statusinformation 

(a) der Status der Status-Signal <ier PAE, die von 0901/0902 konfiguriert vnrd sein (Fig. 10a). 

(b) ein beliebiges uber 0802 zugefiihrtes Statussignal sein (Fig. 10b). 
6S (c) eine Komhination ans (a) und (b) sein. 

Ziun einfachen Verstandnis kann 0901 als ein Speicher betiachtet werden, wobei Uber 0902 ein Befehl von 1001 adies- 
siert wird. Die Adressierung ist dabei abhSingig vom Befehl selbst und von einem Statusregister. Insoweit entspiicht der 
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Aufbau eioer "von Neumann" Maschine, mit dem Unterschied, 

(a) der universellen Einsetzbarkeil, also den Sequenzer nicht zu verwenden (vgl. Fig. 9) 

(b) daB das Slatussignal nicht von dent dem Sequenzer zugeordneten Rechenwerk (PAE) generiert werden muB, 
sondem von einem beliebigen andeien Rechenwerk stammen kann (vgL Fig. 10b). S 

Wichtig ist, dafi der Sequenzer dabei Spriinge, insbesondere aucb bedingte Spriinge, innerhalb von 0901 ausfiihien 
kann. 

£io weiteres zusatzliches oder altemadves \%rfahien (Fig. 11) zum Aufbau von Sequenzem innerhalb der genannten 
Baustfine ist die Veiwendung der intemen Datenspeicher (UOl) zum Speichem der Xonfigurationsinformation fiir eine lO 
PAR Dabei wird der Dateaausgang eines Speichers auf einen Konfigurationseingang einer geschaltet (1102). Die 
Adresse (1103) fiir UOl kann dabei von derselben PAE oder einer beliebigen anderen generiert werden. 

Bei diesem Verfahren ist der Sequenzer nicht fest implementiert, sondem wild durch eine PA£ oder eine Gruppe von 
PAEs nachgebildet 

IS 

Patentanspiiicbe 

1. Verfahren zum Ausfiihren von Programmen auf einem Baustan niit ein- oder mehrdimensionaler Zellstruktur, 
dadurdi gekennzdcliiiet, dass Datenfluss- oder KontroUflussgraphen in zdtlich getiennte Ibilgraphen partitioniert 
werdeo und seqaentiell auf den Baustein abgebildet und ausgefuhn werdoi. 20 

2. Hardware mit entkoppdtem KoniiguratioDaegistBr. 
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